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Beschreibung 

Auswahl der Benutzersprache an einem rein akustisch 
gesteuerten Telefon 

5 

Bei Kommunikations- und Inf ormationsgerSten werden textuelle 
Inf ormationen in der durch die Landerversion vorgegebenen 
Sprache dargestellt. Damit einhergehend gibt es fur den 
Benutzer die Moglichkeit, die gewunschte Sprache als 

10 Benutzersprache oder Bediensprache einzustellen. Wenn jetzt - 
aus welchem Grund auch immer - die Sprache der 
Benutzeroberf lache verstellt ist, steht der Benutzer vor dem 
Problem, die gewunschte Benutzersprache wieder einzustellen, 
ohne dass er zu dem betreffenden Meniieintrag oder 

15 Steuerungszustand durch textuelle Ruckmeldungen gefuhrt 
werden kann. 

Dieses Problem besteht allgemein und ist nicht auf grafische 
Benutzeroberf lache mit Tastatur- oder Mauseingabe beschrankt . 

20 Im Gegenteil wird es in Zukunft mehr und mehr Endgerate 
geben, die rein akustisch bedient werden. Auch bei Call- 
Centern, bei denen ebenfalls eine rein akustische Bedienung 
vorgenommen wird, stellt sich das Problem. Dabei erfolgt die 
Sprache ingabe uber Spracherkennung und die Sprachausgabe 

25 entweder durch Abspielen vorgef ertigter Sprachkonserven oder 
durch automatisierte Sprachsyn these in Form einer Text-zu- 
Sprache-Umwandlung . 

Bei GerSten mit Bildschirm- bzw. Display- und Tastatureingabe 
30 findet man zur Ldsung des dargestellten Problems folgende 

Vorgehensweise: Im Allgemeinen gibt es die Moglichkeit, das 
Gerat auf die werkseitig vorhandene Spracheinstellung 
zuruckzusetzen. Dies erfolgt meist durch eine bestimmte 
Tastenkombination. Ebenso gibt es GerSte, bei denen sich auf 
35 einfache Weise ein Sprachmenu aktivieren lasst, indem der 

Benutzer die Zielsprache auswShlen kann. Das sieht dann etwa 
wie folgt aus: 
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Deutsch 

Frangais 

English 

YKpaiHeub 

(Ukrainisch) 
Romanes c 

( Rumanisch) 



Tabelle 1 

In diesem Menu kann der Benutzer nun die gewiinschte und damit 
einzustellende Benutzersprache auswahlen . Eine solche 
5 Vorgehensweise ist fUr rein akustisch gesteuerte Gerate 
natiirlich nicht moglich. 

Davon ausgehend liegt der Erfindung die Aufgabe zugrunde, die 
Auswahl der Benutzersprache einer Vorrichtung mittels eines 
10 rein akustischen Verfahrens zu ermoglichen. Die 

Auswahlmoglichkeit soil auch gerade dann zur Verfiigung 
stehen, wenn die Vorrichtung keine Unterstutzung durch eine 
Anzeige leisten kann oder soil . 

15 Diese Aufgabe wird durch die in den unabhangigen Anspruchen 
angegebenen Erf indungen gelost . Vorteilhaf te Ausgestaltungen 
ergeben sich aus den Unteranspruchen . Durch die Erfindung 
kann die einzustellende Benutzersprache einer Vorrichtung 
einfach dadurch eingestellt werden, dass zur Auswahl der 

20 Benutzersprache einfach die einzustellende Benutzersprache 
gesprochen wird. Ein Englander sagt also: "English", ein 
Deutscher sagt einfach "Deutsch", ein Franzose sagt 
"Frangais" und ein Ukrainer sagt "Ukraj ins 1 kyj " (englische 
Transliteration von "ukrainisch" in polnischer Schrift) . 

25 

Die Realisierung dieser Funktionalitat in den 
Spracherkennungsmitteln der Vorrichtung ist keineswegs 
trivial, weshalb im Folgenden bevorzugte Moglichkeiten 
genauer dargestellt werden sollen. 
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Eine MOglichkeit besteht darin, einen Einzelworterkenner auf 
die zu erkennenden Bezeichnungen der einstellbaren 
Benutzersprachen zu trainieren. Da die hier verwendeten 
5 Algorithmen zumeist auf bloSem Mustervergleich basieren, 
benStigt man fur das Training eine ausreichende Anzahl von 
Sprachkons erven, in denen die Sprache (als Wort) von 
muttersprachlichen Sprechern zu der entsprechenden Sprache 
(als Code) auf gesprochen ist. Hierbei kann insbesondere ein 
10 Dynamic-Time-Warp ( „DTW" ) -Erkenner zu Einsatz kommen, 

Sollte die Vorrichtung, etwa fur andere Funktionalit&ten, 
bereits uber eine phonembasierte Spracherkennung verfiigen, so 
ist es vorteilhaft, diese fur das Einstellen der 
15 Benutzersprache heranzuziehen. Dazu ergeben sich drei 
Moglichkeiten . 

So kann in den Spracherkennungsmitteln ein multilinguales 
Hidden-Markov-Model 1 ( „HMM" ) zur Anwendung kommen, das die 
20 Phoneme aller Sprachen modelliert. Hierfur ist eine 

standardisierte Darstellung eines phonetischen Alphabets 
besonders vorteilhaft, etwa in der Form von SAMPA-Phonemen. 

So uberzeugend dieser Ansatz fur die geschilderte 
25 Problems tel lung ist, zeigen sich doch in der Praxis 
multilinguale Spracherkennungsmittel beztiglich der 
Erkennungsrate einer sprachspezif ischen Modellierung 
unterlegen. Fur die normale Spracherkennung in der 
Vorrichtung wtirde also noch ein weiteres akustisches Modell 
30 benotigt, welches weiteren Speicherplatz verbrauchte. 

Deshalb erweist sich eine andere Moglichkeit als vorteilhaft, 
bei der die zu den Bezeichnungen der einstellbaren 
Benutzersprachen gehorigen phonemsequenzen aus den HMMs % f iir 
35 die unterschiedlichen Sprachen kombiniert sind. Hierbei muss 
allerdings bedacht werden, dass die Uber e ins timmungsmafie, die 
die Spracherkennung fur die in unterschiedlichen 
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Phoneminventaren modellierten Worter liefert, nicht direkt 
miteinander vergleichbar sind. Dieses Problem kann umgangen 
werden, wenn im kombinierten HMM die UbereinstimmungsmaSe ftir 
die Phonemsequenzen aus den unterschiedlichen erkennbaren 
5 Benutzersprachen skaliert sind. 

Eine besonders geschickte Moglichkeit ergibt sich, wenn man 
statt eines multilingualen HMMs oder der Kombination von 
Phonemsequenzen mehrerer sprachspezif ischer HMMs nur ein 

10 einziges sprachspezif isches bzw. landerspezif isches HMM 
verwendet und dabei die Bezeichnungen der fremden 
Benutzersprachen mit dem sprachspezif ischen Phonemsatz 
modelliert. Zur Erlauterung dient das folgende Beispiel fur 
die deutsche Sprache, das dem Menu in Tabelle 1 nachempf unden 

15 ist. Die Wortmodelle sind in "phonetischer " Schreibweise : 



/ 


d 


eu t sh / 


/ 


f 


r o ng s ae / 


/ 


i 


ng 1 i sh / 


/ 


u 


k r ai n sk i j / 


/ 


r 


omaneshtsh/ 



Tabelle 2 



Hier entfailt die Notwendigkeit , ein multilinguales HMM zu 
20 verwenden oder Phonemsequenzen mit unterschiedlichen 
Phoneminventaren bei der Erkennung zu kombinieren. 

GemalS der einleitenden Problemstellung ist die Vorrichtung 
insbesondere ein mobiles Endgerat in Form eines Mobil- oder 
25 Schnurlostelefons, ein Headset oder der Server eines Call- 
Centers . 

Bevorzugte Ausgestaltungen des erf indungsgemafien Verfahrens 
ergeben sich analog zu den dargestellten bevorzugten 
30 Ausgestaltungen der erf indungsgemaSen Vorrichtung, 
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Weitere wesentliche Merkmale und Vorteile der Erfindung 
ergeben sich aus der Beschreibung eines Ausf uhrungsbei spiels 
anhand der Zeichnung. Dabei zeigt: 

5 Figur 1 den Ablauf bei der Einstellung der Benutzersprache . 

Die Vorrichtung kann in Form eines schnurlosen Headsets 
verwirklicht sein, das ausschlieSlich \iber Sprache gesteuert 
wird. Dies kann beispielsweise ein Headset sein, das liber 
10 Bluetooth, Dect, GSM, UMTS, GAP oder einen anderen 

Ubertragungs standard mit oder ohne Kabel eine Verbindung zu 
einer Basis aufnimmt. 

Das Headset weist eine On- /Of f -Taste sowie eine so genannte 
15 "P2T-Taste" ("push-to-talk") auf, mit der der Audiokanal fur 
ein bestimmtes Zeitfenster auf die Spracherkennungsmittel 
geschaltet wird. Die Kommandosteuerung des Headsets 
beinhaltet das kurze Drucken der P2T-Taste, ein Quittieren 
des Tastendrucks durch einen kurzen Piep-Ton und das 
2 0 anschlieSende Sprechen des gewunschten Kommandos, worauf die 
Vorrichtung entsprechend reagiert. 

Beim ersten Einschalten der Vorrichtung (Schritt 1) bzw. nach 
einem Zurucksetzen der Vorrichtung (Schritt 2) , was 

2 5 beispielsweise durch ein langeres Drucken auf die P2T-Taste 
hervorgeruf en wird, befindet sich der Benutzer zunachst in 
der Benutzersprachauswahl . Dies wird dem Benutzer durch ein 
akustisches Signal (Schritt 3) mitgeteilt, das beispielsweise 
in einem langeren Piep-Ton oder einer mehrsprachigen 

30 Aufforderung zum Einsprechen der einzustellenden 
Benutzersprache besteht . 

Der Benutzer spricht nun die Bezeichnung der einzustellenden 
Sprache in der einzustellenden Sprache in die Vorrichtung ein 
35 (Schritt 4) . Die Spracherkennungsmittel der Vorrichtung 
erkennen nun die in der einzustellenden Benutzersprache 
gesprochene Bezeichnung der einzustellenden Benutzersprache, 
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soweit es sich bei der einzustellenden Benutzersprache um 
eine der mehreren einstellbaren Benutzersprachen der 
Vorrichtung handelt. Daraufhin stellen die 
Benutzerspracheneinstellungsmittel der Vorrichtung die 
5 Benutzersprache der Vorrichtung auf die von den 

Spracherkennungsmitteln erkannte Benutzersprache ein, wodurch 
die Vorrichtung entsprechend initialisiert wird. AnschlieSend 
kann mit der Vorrichtung gearbeitet werden (Schritt 6), als 
ob sie normal eingeschaltet wurde (Schritt 5) . 

10 

Bei der Korrektur von Spracherkennungs- und Bedienf ehlern 
kann auf bewahrte Mittel und Verfahren aus dem Stand der 
Technik zuruckgegrif f en werden. 

15 Allen Ausf uhrungsf ormen der Erfindung ist der herausragende 
Vorteil einer deut lichen Vereinf achung und Verkurzung der 
Bedienung der Vorrichtung gemeinsam. Weiterhin gibt es, 
sofern eine phonembasierte Erkennung verwendet wird, nicht 
die Notwendigkeit, Sprachkonserven in der Vorrichtung 

20 abzulegen. Die Tatsache, dass bereits phonembasierte 

akustische Ressourcen in der Vorrichtung vorhanden sind, wird 
dabei optimal ausgenutzt. 
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Patentansprtiche 

1. Vorrichtung mit 

- Spracherkennungsmitteln zum Erkennen einer in einer 

5 einzustellenden Benutzersprache gesprochenen Bezeichnung der 
einzustellenden Benutzersprache der Vorrichtung, 
wobei mehrere einstellbare Benutzersprachen der Vorrichtung 
durch die Spracherkennungsmittel erkennbar sind, indem die 
Bezeichnung der jeweils einzustellenden Benutzersprache in 
10 der einzustellenden Benutzersprache gesprochen wird, 

- Benutzerspracheneinstellungsmitteln zum Einstellen der 
Benutzersprache der Vorrichtung auf die von den 
Spracherkennungsmitteln erkannte Benutzersprache. 

15 2. Vorrichtung nach Anspruch 1, 
dadurch gekennzeichnet, 

dass die Spracherkennungsmittel einen Einzelworterkenner 
aufweisen . 

20 3. Vorrichtung nach Anspruch 1, 
dadurch gekennzeichnet, 

dass die Spracherkennungsmittel einen phonembasierten 
Erkenner aufweisen. 

2 5 4. Vorrichtung nach Anspruch 3, 

gekennzeichnet durch 

ein multilinguales Hidden-Markov-Model 1 , das von den 
Spracherkennungsmitteln verwendbar ist. 

3 0 5. Vorrichtung nach Anspruch 3, 

gekennzeichnet durch 

ein kombiniertes Hidden-Markov-Model 1 , das Phonemsequenzen 
aus den mehreren erkennbaren Benutzersprachen enthalt und von 
den Spracherkennungsmitteln verwendbar ist. 

35 

6 . Vorrichtung nach Anspruch 5 , 
dadurch gekennzeichnet, 
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dass im kombinierten Hidden-Markov-Modell die 

UbereinstimmungsmaSe fur die Phonemsequenzen aus den mehreren 
erkennbaren Bediensprachen skaliert sind. 

5 7. Vorrichtung nach Anspruch 3, 
gekennzeichnet durch 

ein sprachspezif isches Hidden-Markov-Model 1, bei dem die 
Phoneme fur die Bezeichnungen der mehreren erkennbaren 
Benutzersprachen mit dem sprachspezif ischen Phonemsatz des 
10 sprachspezif ischen Hidden-Markov-Modells modelliert sind. 

8. Vorrichtung nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dass die Vorrichtung ein mobiles Endgerat ist. 

15 

9. Vorrichtung nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dass die Vorrichtung Mittel zur Ausgabe einer Aufforderung 
zum Einsprechen der Bezeichnung der einzustellenden 
20 Benutzersprache aufweist. 

10. Verfahren zum Einstellen einer Benutzersprache einer 
Vorrichtung, 

- bei dem mehrere einstellbare Benutzersprachen durch eine 
25 Spracherkennung erkennbar sind/ wenn die Bezeichnung der 

jeweils einzustellenden Benutzersprache in der 
einzustellenden Benutzersprache gesprochen wird, 

- bei dem die in der einzustellenden Benutzersprache 
gesprochene Bezeichnung der einzustellenden Benutzersprache 

3 0 erkannt wird, 

- bei dem die erkannte einzustellende Benutzersprache als 
Benutzersprache der Vorrichtung eingestellt wird. 
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